# python数据基础第五节：导入数据
"""
    数据处理：pandas
    数据计算：NumPy
    数据可视化：matplotlib
"""
# 导入读取csv的模块（read_csv）
# 导入读取文本文件的模块（read_table）
# 导入excel文件的模块(read_excel)
from pandas import read_csv,read_table,read_excel
# 导入读取文本文件的模块

csv_df = read_csv('E:\Python\pyspark_demo01\data\data.csv',encoding='UTF-8')

# 导入文本文件 可以指定path，names=["列名1"，"列名二"]，sep="分割符"
txt_df1 = read_table("E:\\Python\\pyspark_demo01\\data\\txt_data.txt")
txt_df2 = read_table("E:\\Python\\pyspark_demo01\\data\\txt_data.txt",names=["age","name"],sep=",")

# 导入excel文件
exec_df1 = read_excel("E:\Python\pyspark_demo01\data\movies_pf.xls",sheetname="Sheet2")

